Objectifs d'apprentissage
- Évaluer l'efficacité du modèle d'exécution SIMT sur les charges de travail parallèles
- Identifier les goulets d'étranglement liés à la divergence de branches et à la sérialisation
- Analyser les techniques de masquage de latence mémoire dans le planification des warps
- Calculer les métriques d'utilisation et d'occupation pour les noyaux GPU